プロジェクト‐ノート:日本の法令

ページのコンテンツが他言語でサポートされていません。

法令データ提供システムの稼働終了[編集]

こんにちは。Kurihaya と申します(当 PJ の参加者ではありません)。2017 年 10 月 2 日をもって旧「法令データ提供システム」 http://law.e-gov.go.jp/ は稼働を終了し、「e-Gov法令検索」 http://elaws.e-gov.go.jp/ に移行しました(使い勝手が慣れない)。出典や注釈を含め多くの外部リンクがありますが、どうしたものでしょうかね。--Kurihaya会話2017年10月2日 (月) 03:35 (UTC)[返信]

私も参加者ではないのですが、たまたまとある法律の条文リンクを押したら以前と違うページになっていたので何かあったのかと思いここにたどり着きました。
ざっと調べたところ、とりあえず(以下、法令データ提供システムを旧版、e-Gov法令検索を新版と表記します)
  • 旧版へのリンクは自動的に新版にリダイレクトされる(例:水道法)。
    • ただし、既に廃止された/失効した法律のデータは新版にはないようで、リダイレクトされずに404エラーが表示される(例:テロ対策特別措置法)。
といった状態のようです。
よって、現存する法律(Category:日本の法律)については、いつか新版にリダイレクトされなくなった時に備えてリンクを張り替える(bot等で。仕組みとしては本文にあるhttp://law.e-gov.go.jp/から始まるurlにアクセス→飛ばされた先のurlで本文のurlを書き換え。ただすごく大変そう…)のがいいと思いますが、当面並行稼動すると案内されています[1]ので急ぐ必要はないと思います。
廃止された法律(Category:廃止された日本の法律)についてはリンク切れしていますので、早いうちにWikisourceや、日本国憲法施行後の法律については廃止後も削除されない衆議院Webサイト(例:テロ対策特別措置法の条文)のリンクに張り替える(どちらもなければ治安警察法のような方式も可)必要があると思います。
余談ですが、廃止された/失効した法律の条文が消えるというのは厄介なので、少なくとも時限立法の法律に新版のリンクを張るのは非推奨にするのが良さそうです(代わりにWikisourceまたは衆議院Webサイトを推奨)。--ひむちや (会話/投稿記録) 2017年10月2日 (月) 13:39 (UTC)[返信]
例示いただいた記事「水道法」の場合、テンプレート内のリンク http://law.e-gov.go.jp/htmldata/S32/S32HO177.html は新版にリダイレクトされますが、外部リンク節の http://law.e-gov.go.jp/cgi-bin/idxselect.cgi?IDX_OPT=1&H_NAME=%90%85%93%b9%96%40&H_NAME_YOMI=%82%a0&H_NO_GENGO=H&H_NO_YEAR=&H_NO_TYPE=2&H_NO_NO=&H_FILE_NAME=S32HO177&H_RYAKU=1&H_CTG=1&H_YOMI_GUN=1&H_CTG_GUN=1 はエラーになります。後者の形式の外部リンクも多いでしょうから、もしこの状態が続く場合には手間がかかりそうですね(e-Gov が対応してくれることを期待しつつ)。後者の URL をよく見れば「昭和三十二年法律第百七十七号」が見つかりはしますけれど。--Kurihaya会話2017年10月3日 (火) 06:42 (UTC)[返信]
返信 ああ…これですか。これ、e-Govのサイトに「一部のリンク(URLに「.cgi」を含むもの。)については、e-Gov法令検索へのリダイレクトが正常に行われない事象が発生しています。このような場合には、e-Gov法令検索のトップページから改めて検索いただきますようお願いいたします。」って書いてありますので、向こうも認識してるようです。ですが、いつ対応してくれるかは分かりません。
元の話とは少々ズレますが、この死んでるcgiのリンクを、新版にリダイレクトされる旧版のURLに書き換えるという作業なら機械的にできるので、bot作業依頼に出せば引き受けてくれると思います。
こんな感じです。テストしたところ正常に置換されました。これでとりあえず現行法でリンク切れしてるやつは解消できます。依頼出しますか?--ひむちや (会話/投稿記録) 2017年10月3日 (火) 13:29 (UTC)[返信]
情報 現在は、旧版 から 新版へのリダイレクトは全て行われなくなっているようです。--Yuukin0248[会話/履歴] 2019年8月1日 (木) 06:35 (UTC)[返信]
  • 提案 上位プロジェクトのプロジェクト:法学で活動しております、ProfessorPineと申します。Bot作業依頼上でも申し上げたのですが、こちらに再掲します。e-GovのHTTPS必須対応が2019年6月に発生した件は、すでに900件程度のページを昨日、Yuukin0248さん運用のBotで置換して頂きました。が、いまだ別のリンク切れが大量に残っています。
【問題の状況】2017年6月にe-Govがリニューアルした際にドメイン変更が起こり、2018年10月には旧ドメインからのリダイレクトを停止しています。そのため、現在968ページ上でリンク切れが発生しています。対象ページはこちら ⇒ Special:Search/insource:"http://law.e-gov.go.jp" (旧ドメインは頭にe-lawsが入らない)。ドメイン名を http://law.e-gov.go.jp から https://elaws.e-gov.go.jp に置換しても、その後ろに続く引数の仕組みが変わってしまったようで、404エラーになってしまいます。つまり、旧ドメインをつかっている場合は、一から手作業で検索してリンクを貼りなおす必要がありそうです。
【対応案】そこでご相談なのですが、旧ドメインを使っている968件のノートページに、「e-Govのリンク切れが起こってます。修正して下さい」みたいなアラートメッセージをBotで貼り付けてもらえれば、気付いて手修正してくれる人も多少は増えるのかなと思うのですが、いかがでしょうか? できれば記事ページ本文のe-Govリンクの真横に{{リンク切れ}}を挿入してもらえればベストなのですが、<ref>{{Cite web|url=http://law.e-gov.go.jp ...}}</ref>だったり、Refタグなしの[[http://law.e-gov.go.jp ...]]だったり、さまざまな記法が混在して、{{リンク切れ}}を狙った場所にBotで挿入するのが難しいのかな、と思ったからなのですが、どなたか別案あれば是非アイディアお聞かせ下さい。--ProfessorPine会話2019年8月1日 (木) 15:30 (UTC)[返信]
コメント 正直、この数のリンク切れを手作業で修正するというのはかなり無理があると思うんですよね。つまり、Bot を使って一気に直してしまうというのが一番近道だと考えています。しかし、その場合は、リンク切れしているページに対応する新しいページを見つけるのはほぼ確実に手作業になるし、出典についている参照情報を対応させるのもBotでは全てできないだろうし、という風になります。Bot を使うのであれば、{{Cite web}} を使っている形にはある程度の修正は効きますが、手入力で[http://law.e-gov.go.jp 法令データ提供システム]のような形を使っている場合はどうしようもありません。要は、リンクを直すリストを手作業で用意しても、参照情報を全て完璧に直すのは手作業でないと無理ということです。
ノートページにメッセージを貼り付ける方法ですが、そのメッセージを読んで直してもらうよりも、プロジェクト側で人を集めて慣れた作業でこなしていく、という風にするのが早いかもしれません。Special:Search/insource:"http://law.e-gov.go.jp"を見る限り、広い分野の記事でリンク切れしているので、分野が違う人に直してもらうよりも私達で直したほうが早いんじゃないか、という話です。まあ実際どうなるのかはわかりませんので、参考程度に。--Yuukin0248[会話/履歴] 2019年8月3日 (土) 01:56 (UTC)[返信]
正しいリンクの検索は手作業になるので、これを誰かが引き受けて一気にやるか (Yuukin0248さん案)、気付いた人がページ個別に直すのを待つかしかなさそうです。で、私の温度感だけお伝えしておくと、日本国外の記事をメインで編集している関係上、編集優先度的に私がこの手作業を引き受けるつもりはないです。すみません。ということで、Botでアラートメッセージだけ貼り付けておけば、後者の個別対応に気付く方が多少は増えるかなと思って提案してみたわけです。代替案として、Botによる個別ページへのアラートではなく、Wikipedia:お知らせWikipedia:コメント依頼で修正者を募るというのも考えられると思います。--ProfessorPine会話2019年8月5日 (月) 12:07 (UTC)[返信]
コメント Bot を使用したノートページへの通知の展開について特に賛否はありませんが、コミュニティ全体に依頼するという方法もあるよ、という提案でした。あまり気になさらないでください。
その後、修正先のリンクを簡単に発見する方法を模索していたのですが、ウェイバックマシン を使う方法を思いつきました。切れている URL を入力すれば、リダイレクトされていた当時のページへそのままリダイレクトされます。例えば、「市町村長」の「地方自治法」というリンクをクリックしても接続がタイムアウトしますが、このリンクの URL を Wayback Machine に入力し、法令データ提供システムが廃止されてからリダイレクトが停止されるまでの期間のアーカイブを選択すると e-Gov の [2] に飛ばされます。このURLの "http://elaws.e-gov.go.jp/search/elawsSearch/elaws_search/lsg0500/detail?lawId=322AC0000000067&openerCode=1" から http を https に直せば、そのまま使えるリンクになります。
あるいは、新しいリンクに直す事を諦めることになりますが、法令データ提供システムの廃止以前に Wayback Machine が生成したアーカイブ [3] を使えば、修正の手間は一気に減りますね。Wayback Machine を使う方法であれば、API を使ってアーカイブの URL を簡単に取得できるため、作業はかなり高速に行えると思われます。また、IABot 管理インターフェイスを用いれば自動化できます。アーカイブの活用については非常に有効だと思われます。いかがでしょうか。--Yuukin0248[会話/履歴] 2019年8月11日 (日) 08:46 (UTC)[返信]
Yuukin0248さん、ウェイバックマシン活用の別案2点の提示ありがとうございます。返信遅くなってすみません。念のため確認なのですが、1番目の案は、手作業で旧URLをウェイバックマシンに打ち込んで、ドメイン変更後の新URLを取得し、それをHTTPからHTTPSに書き直す、という3ステップでよろしいでしょうか? この場合、人海戦術にならざるをえないが、最新URLを取得できるため正確性の観点からは望ましい、と。そして2番目の案は、最新URLではなくアーカイブ参照になるため、記事によってはアーカイブが不適切な参照となるため、IABot 管理インターフェイスを用いることができる記事対象を絞り込み一覧化しないとまずいと思うのですが、この認識は正しいでしょうか。例えば、(例1) 記事本文中に「XX権の時効はYY年で消滅する」(出典e-GOV) となっているケースだと、アーカイブ断面と本文記述断面が近くないと、法改正で間違ったアーカイブを使ってしまうおそれがあるという問題があります。また、(例2) 記事本文ではなく「外部リンク」節に参考URLとしてe-GOVのリンクを貼っているパターンだと、最新版にリンクしていないと意味がないので、IABot 管理インターフェイスの利用リストから除外する必要があると思います。とりあえず気付いたのはこんなところです。
最後に。誠に申し訳ないのですが、私には本件にそこまで関与できる時間的余裕がとれず、きつい状況です。「Wikipedia:コメント依頼」やこのページの表に{{コメント依頼}}を掲示するなどして、議論参加者を募って頂いた方がいいかもしれません。ご検討頂けないでしょうか。--ProfessorPine会話2019年8月19日 (月) 12:04 (UTC)[返信]
──────────────────────────────────────────────────────────────────────────────────────────────────── 初めに、ProfessorPineさんが本件に関与する余裕がない旨、了解致しました。コメント依頼等の活用については適切なタイミングで行っていこうと思います。現状、私も解決案のメリットデメリットについて深く精査できておりませんので、本件の解決についてはまだ時間を頂くことになるかと思います。
さて、ProfessorPineさんから指摘ありましたアーカイブ参照の問題点ですが、考えておりませんでした。提案に対する問題点の指摘、感謝します。IABot 管理インターフェイスを用いた機械的な置き換えを行う場合は、{{Cite web}} 等の使用時は accessdate パラメータからみて適切なアーカイブを取得する仕様のはずです。しかし、それらの出典テンプレートを使用していない場合はリンク切れしていない最新版アーカイブを持ってくる仕様になっていると思われます。そのため、やはり機械的に全て置き換えるのは不可能、という事になると思います。現時点で私からお話できることは以上になります。数週間程度頂くことになるかと思いますが、確実な解決策とコメント依頼を伴って提案しようと思いますので、よろしくお願いします。--Yuukin0248[会話/履歴] 2019年8月24日 (土) 12:43 (UTC)[返信]
いろいろ考えていたのですが何も思いつかなかったので2か月以上の間放置状態になっていました。すいません。
@Kurihaya and ProfessorPine: 下記 #修正方法の提案 にて修正方法について提案しています。ご意見いただけましたら幸いです。--Yuukin0248[会話/投稿記録] 2019年11月2日 (土) 07:58 (UTC)[返信]

修正方法の提案[編集]

  1. 全部手動で修正する。法令データ提供システムから e-Gov へのリダイレクトが行われていた時期のアーカイブを使うことでリダイレクト先を特定することができ、ある程度の効率化は可能。一方、法改正などの兼ね合いにより別の時期の法律にリンクしてしまう場合は適切なページにリンクすることが難しい場合もあります。また、親の節冒頭で行われている議論により "cgi" を含む URL からのリダイレクトが機能しないことが指摘されており、それの修正は正規表現を使った機械的な置換が必要 (先に Bot で修正しておいても良い)。修正が必要なノートページに告知を行うことも考えられる。
    • 正確性の観点では望ましい。しかし、人海戦術とならざるを得ない。全て作業をするのに、1人100編集したとしても10人も必要。また、1ページあたりにかかる時間も非常に長くなる可能性がある。
  2. Wayback Machine API を使ってアーカイブ、もしくは新ページを取得し半自動で適切な形に修正する (Bot 使用)。記事にある法令データ提供システムの URL を抽出する。"cgi" を含むものについては前述の通り正規表現で置換する。{{Cite web}} 等の accessdate 指定がある場合はそれに沿って API からアーカイブの URL を取得し、archiveurl, archivedate パラメータとして加える。{{Cite web}} が使われていない場合は手動で修正する。また、単純に新ページへのリンク置き換えで解決するものは自動的に置き換える。必要なプログラムの準備は私が行います。
    • accessdate が指定されている場合はほぼ確実に執筆当時のページを制限できると思われる。つまり正確性の観点から見ると、第一案の次点といったところ。一方、プログラムの準備に時間がかかる、プログラムを1人で実行していても、正確性のため半自動なので時間がかかる (と言っても、第一案よりかはマシだと思われる)。
  3. IABot 管理インターフェイスを使う。旧リンクが含まれる前記事を精査し、IABot 管理インターフェイスを用いた機械的な修正を行っても問題がないページを抽出。機械的な修正をすると問題が発生する場合は手動で修正する。
    • 思い通りのリンクに置き換えることができるか分からないので、正確性の観点ではあまりよろしくないかもしれない。抽出作業と手動修正だけ終わらせてしまえば後は自動で行われるので、手間は少ない。

(初版) 3案追加 --Yuukin0248[会話/投稿記録] 2019年11月2日 (土) 07:58 (UTC) (第2版) 書き漏れを修正 --Yuukin0248[会話/投稿記録] 2019年11月20日 (水) 08:32 (UTC)[返信]

各案について何かご意見を頂戴したいと思います。よろしくお願いします。なお、本件についてコメント依頼を行っています。--Yuukin0248[会話/投稿記録] 2019年11月2日 (土) 07:58 (UTC)[返信]

  • @Yuukin0248さん、3つのご提案ありがとうございます。どこまで参考になるか分かりませんが、Special:Search/insource:"http://law.e-gov.go.jp" でヒットする961ページのサンプル調査をした結果を一覧表にまとめます。関連度の高い順に上位15ページ、下位5ページを抽出しています。パっと見だと案2が良さそうだなと思ったのですが、実態は{{Cite web}}などを使わず、外部リンクベタ打ち方式が多いため、案1と案2で作業工数にあまり変わりがないのかも...という懸念があります。
一覧表の見方について補足します。
  1. 記事1ページあたり、リンク切れしたe-GovのURLを複数箇所使用しているパターンがあります。例えば連番9のトンは、本文中に4か所使用しているため、上表が4行になっています。
  2. 「記述箇所」は記事本文に出典として使っているのか、外部リンク節や参考文献節に使用しているのかの判別です。
  3. 「URLタイプ」は.cgiを使っているタイプ (正規表現で置換が必要) 以外に、現行法の「/htmldata/」のタイプと、既に廃止された法律の「/haishi/」がありました。
  4. 「記述タイプ」ですが、Cite webを使用しているのは全体の2割に留まっています。残り8割はベタ打ちなのですが、[http://URL リンク名]のように、URL+空白+リンク名が書いてあるものと、リンク名が省略されているものが混在しています。
  5. 「閲覧日」と「Archiveurl」はCite webを使っている場合、引数に何が書いてあるかを示しています。
解決策の検討につながるか分かりませんが、ご参考までに。--ProfessorPine会話2019年11月4日 (月) 05:18 (UTC)[返信]
詳細な実態の調査、ありがとうございます。以前の印象では外部リンクの節に置かれていることが多いなあという感じで単純に新ページへ置き換えるだけで済む割合が高いのではないかと考えていたのですが、やはり出典として使用されている割合が思いのほか高いため面倒なことが多そうですね。パターン別で「Bot で対応する」「手動で修正する」に分けて直していくのが良いのでしょうか…。手動で修正するページに対しては、ノートページへの告知という方法も考えられると思います。ひとまず、最初の提案から1か月になるまでは待ってみようと思います。--Yuukin0248[会話/投稿記録] 2019年11月20日 (水) 08:32 (UTC)[返信]
@Yuukin0248さん、手動修正についてアイディアです。現在「井戸端」にて出典をつける大会企画について協議されています。で、ご覧頂ければ分かる通り、機械的に出典をつけたり表記統一して、点数を稼ぐことに対して否定的な意見が出ています。井戸端以外にも、企画提案者個人の会話ページでも懸念の声が。。。これに対して私見を申し上げると、私も「大会」として闇雲に出典をいじることには否定的です。ですが、今回のe-Govのリンク切れ約1000本に限定すれば、まさにヤル気あるユーザさんに手動修正してもらえればお互いハッピーな案件です。そこで、「大会はやめて、単発のe-Govリンク切れ対応プロジェクトに企画変更しませんか?」と持ち掛けてみてはどうかと思うのですが、いかがでしょうか? ちなみに私自身が修正対応を直でやることはありませんが、修正後の品質チェックぐらいは私も参加させて頂きますし、また作業開始にあたって修正対象リストを作成し、進捗管理する程度のことはやってもいいかなと思っています。--ProfessorPine会話2019年12月8日 (日) 07:40 (UTC)[返信]
ProfessorPineさん宛 期間を設定しておきながら失念しており失礼しました。ProfessorPineさんのコメント後、私が風邪をこじらせてしまっている間に状況が変わっているみたいです。
井戸端での当該議論を読みましたが、議論は悪い意味で白熱し提案者は大会開催を中止すると発言し、さらには提案者に対する投稿ブロック依頼まで提出される始末となっているようです。投稿ブロック依頼は現時点ではまだ審議途中ですが、有期または無期の賛成票が複数入っている状況です。そのため、大会の提案者に対して「企画変更」を持ちかけるのは無意味かと思います。また、代替となる大会を主催する人物も現時点では現れていません。で、肝心の今後の方針ですが。ProfessorPineさんの実態調査の結果や、全部手動で修正するのが最も正確という点から鑑みて、複数の利用者で手動で全て修正するという事にしましょうか。ProfessorPineさんの「単発のe-Govリンク切れ対応プロジェクト」という提案もありましたし。--Yuukin0248[会話/投稿記録] 2019年12月12日 (木) 07:56 (UTC)[返信]
@Yuukin0248さん、風邪からは完全復活でしょうか? ぶり返しも怖いので、あまりご無理なさらないで下さい。「#e-Gov手動修正の短期プロジェクト企画」⇒「プロジェクト‐ノート:日本の法令/e-Govリンク切れ対応」をとりまとめてみました。この内容でいかがでしょう? つまり井戸端に企画を提示するだけでなく、より積極的に火中の栗を私が拾って、企画提案・運営者として名乗りをあげようと思っています。悪い意味で白熱した分、注目度も高まっているので 、意外と協力者が集まるんじゃないかと (まさしく炎上商法?)。最も量・質ともに貢献が大きかった方には、Wikipedia:感謝賞に私からノミネートする、という報酬くらいなら設定できるかと。--ProfessorPine会話) 2019年12月12日 (木) 10:37 (UTC) ⇒ サブページ化のため募集要項リンクを修正。--ProfessorPine会話2019年12月13日 (金) 08:11 (UTC)[返信]
 追記 すみません1点だけ。もし可能なら、Yuukin0248さんのAWB Botを使って「修正対象一覧」を記事リンク付きで作成して頂くことってできないですかね? 以前私がBot作業依頼を出した時に作ってくださったようなイメージです。一覧の投稿空間ですが、可読性を考慮して、このプロジェクトノートに特設サブページを作った方がいいかも? 大変お手数ですが、併せてご検討のほどよろしくお願いします。--ProfessorPine会話2019年12月12日 (木) 10:44 (UTC)[返信]
早々と進めていただきありがとうございます。一覧はすぐに作れますので、必要な際にお申し付けください。進捗管理に対応した形に準備できます。--Yuukin0248[会話/投稿記録] 2019年12月13日 (金) 06:42 (UTC)[返信]
ご快諾ありがとうございます。募集要項ですが、このノートページ本体に置くのも邪魔くさいので、サブページ化致しました ⇒ プロジェクト‐ノート:日本の法令/e-Govリンク切れ対応。進捗管理表を埋め込むセクションも設けておいたので、お手すきの際に宜しくお願いします。私はこれから井戸端で告知してきます。募集要項にも書きましたが、いったん1週間後の12月20日 (金) 23:59 (JST) まで参加応募を待ち、その後 (21日土曜0時) から作業一斉スタートとしたいと思います。1週間バッファーを設けたのは、私の募集要項の書き方が分かりづらく、ツッコミや訂正が入るかもしれないからです。今回の単発プロジェクトがうまくいったら、Bot作業依頼の下部組織として、Bot取りこぼしを手作業で手伝ってくれるお助け隊を設けてもいいのかもしれませんね (ニーズがあるのか分かりませんが)。--ProfessorPine会話2019年12月13日 (金) 08:11 (UTC)[返信]

e-Gov の HTTPS 化[編集]

上記「法令データ検索システム」につづき、e-Gov で問題が生じました。「e-Govサイト全ページのHTTPS化について [4]」により暗号化(HTTPS 化)が 6 月 27 日に行われましたが、URL「http:~~~」で接続すると「https:~~~」にリダイレクトされず、https://www.e-gov.go.jp/sorry.html に飛ばされます。jawp の e-Gov 向け外部リンクはすべて機能しません。法令データ検索システム終了の際は、「*日閲覧」といったものまで bot で置き換えてはまずいかと放置したのですが、今回は影響が格段に大きく困ってしまいます。--Kurihaya会話2019年6月28日 (金) 07:58 (UTC)[返信]

プロジェクト‐ノート:法学#e-Govサイトのhttps化対応 および Wikipedia:Bot作業依頼 のとおり、https 化についてはBot作業で対応しました。--Yuukin0248[会話/履歴] 2019年8月1日 (木) 06:34 (UTC)[返信]

ショートカットの作成提案[編集]

上位プロジェクトのノート「プロジェクト‐ノート:法学#ショートカットの作成提案」にて、法学、および日本の法令のショートカット2件設置の提案を行っています。ご意見お寄せ下さい。--ProfessorPine会話2020年1月7日 (火) 07:09 (UTC)[返信]

報告 PJ:JPLAW を作成し、プロジェクトページ冒頭にショートカットを掲示しました。--ProfessorPine会話2020年1月15日 (水) 06:00 (UTC)[返信]